深度Q-学习

Back to Home

01. 深度 Q 学习简介
02. 神经网络作为值函数
03. 蒙特卡洛学习
04. 时间差分学习
05. Q 学习
06. 深度 Q 网络
07. 经验回放
08. 固定 Q 目标
09. 深度 Q 学习算法
10. DQN 改进
11. 实现深度 Q 学习
12. TensorFlow 实现
13. 总结

Back to Home

08. 固定 Q 目标

固定 Q 目标

是否曾好奇在现实中会怎样？请观看 Carrot Stick Riding。（该链接为YouTuBe视频，国内网络中可能无法打开）

udacimak v1.4.0